智能晚报|Stability AI开源图像生成平台StableStudio;WPS AI全面到来,但国内用户要用还得等一等...
「每天重要的新闻不会超过五条」
整理:张司钰
编辑:王杰夫
Key Points
Stability AI再开源,AI图像生成平台StableStudio发布。
WPS AI全面到来,但国内用户还得等一等。
Google推出蛋白质结构分析工具。
逐际动力的四足原型机实现关键突破:可正向下楼梯。
玻色量子发布100个计算比特量子计算机。
Stability AI再开源,AI图像生成平台StableStudio发布
5月18日,Stability AI推出开源AI图像生成平台StableStudio,支持在线生成、编辑、修复AI图像。未来StableStudio还将加入AI聊天机器人、插件系统、桌面应用、WebGPU本地推理、ControlNet等工具。
Stability AI是家什么公司?
Stability AI成立于2019年,是生成式AI行业的重要参与者。但与OpenAI、Midjourney等公司不同,这家公司一直主打开源,旗下的图像生成模型Stable Diffusion是行业内使用最广泛的开源模型。开源这意味着任何人都可以查看或下载代码,加上一张显卡,就能在本地训练和部署AI模型。
Stability AI旗下的各种产品都是什么?
Stable Diffusion:这是公司开发的开源图像生成模型,已经迭代了多个版本,最新版本XL暂时还没有开源。
DreamStudio:这是基于自研Stable Diffusion模型开发的盈利性产品,它不需要用户在本地部署,网页上就能直接使用,对标的是Midjourney。
StableStudio:此次推出的StableStudio是DreamStudio的开源版本,可以把它理解为Stable Diffusion与DreamStudio的中间态,比Stable Diffusion更产品化,但又比DreamStudio更灵活,可定制程度更高。
StableLM:这是公司自研开发的大语言模型,你可以把它理解为一个开源版本的GPT,目前只有30 亿和 70 亿个参数两个版本。
StableVicuna:这是公司基于开源大语言模型Vicuna微调后的模型,它与StableLM并列,是这家公司在大语言模型上探索的另一条路。
StableStudio开源意义何在?
更快迭代模型:开源后,社区开发者可以不断改进和试验新的界面,这些改进都将反哺商业版的DreamStudio;
扩大产品影响力:因商业版用户规模有限,相较于闭源产品的私有迭代,Stability AI希望通过开放、社区驱动的发展扩大影响力。
一直以来,Stability AI都是一家崇尚开源的公司,但公司至今没有找到稳定的盈利方向,有消息报道公司上一轮的融资已经见底,正在寻求新的投资。而此次开源的StableStudio可能会与公司唯一的商业化项目产生竞争,让公司的盈利前景更加不明朗。
参考链接
https://github.com/Stability-AI/StableStudio
https://www.semafor.com/article/04/07/2023/stability-ai-is-on-shaky-ground-as-it-burns-through-cash
WPS AI全面到来,但国内用户要用还得等一等
5月16日,金山办公宣布,之前只能通过旗下在线内容写作工具“轻文档”(airPage)体验的生成式AI助手,现在已经全部接入到WPS表格、文字、演示和PDF,同时支持桌面电脑和移动设备。不过由于监管限制,这些新功能暂时只有海外版可以体验。
AI会为WPS带来什么改变?
WPS表格:用户可以直接向WPS表格提问并得到结果,包括调用公式、函数,以及生成相关数据图表;
WPS文字:用户可以下达语音指令,使其自动生成文字内容;可以通过划重点功能快速找到文章重点信息;
WPS演示:用户可以下达指令自动生成并修改演示文稿,以及生成演讲备注;
WPS PDF:手机拍摄相关文档后,用户可以通过提问获得论文、合同、课件等文档的关键信息,并使用文档溯源功能确定信息来源。
WPS AI技术由谁支持?
WPS AI由百度文心千帆大模型平台提供技术支持,金山团队会在应用层优化。文心千帆是百度3月27日推出的面向企业级客户的大语言模型服务平台,提供大模型开发、应用的整套工具,目前有公有云服务、私有化部署两类交付模式。
作为国内唯一可以对标微软Office全线产品的WPS终于有了自己的生成式AI产品。金山办公CEO章庆元曾表示,未来公司在生成式AI产品研发上会“两条腿走路”,首先选择和技术服务商合作,通过它们的技术推动生成式AI产品研发,其次通过投资创业公司的形式提升自己的研发能力。
参考链接
https://mp.weixin.qq.com/s/PQfgZZKMVtw7HyPeg8PNwg
Google推出蛋白质结构分析工具
5月17日,Google Cloud宣布了两个新的AI生命科学解决方案,以帮助生物技术和制药公司加速药物研发。
这两个方案是什么?
靶点及先导化合物识别套件(Target and Lead Identification Suite):帮助研究人员识别氨基酸的功能并预测蛋白质的结构。这套方案允许研究者使用Google Cloud的数据交换平台Analytics Hub来共享和管理从蛋白质上摄取的分子数据,并通过DeepMind开发的机器学习模型AlphaFold2预测蛋白质的结构。
多组学套件(Multiomics Suite):帮助研究者采集、储存、共享大量遗传数据,并做基因组数据分析。
两个方案推出的意义
靶点及先导化合物识别套件:AlphaFold2可以比传统技术更准确地预测蛋白质的三维结构,并满足研究的大规模需求。这简化了药物开发的第一个关键步骤:确定生物靶标即识别蛋白质。如果蛋白质的结构及其在疾病中所扮演的角色得到确认,就可以围绕该目标开发药物。
多组学套件:随着相关设备成本下降,越来越多的生物数据大量产出,包括基因组、转录组、蛋白组、代谢组。据估计到2025年,研究人员将需要40EB的存储空间来储存全球的基因组数据。如何管理这些数据是一个新需求,Google此次推出的多组学套件可以帮助处理这些海量的数据信息,简化数据管理工作。
2021年,曾被寄予厚望的Google Health被拆分后,Google在健康医疗领域的策略也随之改变,它似乎不再想扮演一个直接参与者。从此次推出解决方案的主体是Google Cloud也能看出,在掘金医疗健康上,Google要做那个卖铲子和水的人。
参考链接
https://cloud.google.com/life-sciences-solutions
逐际动力的四足原型机实现关键突破:可正向下楼梯
5月17日,逐际动力的四足原型机X1在38度长楼梯、不规则阶梯、狭窄转身半径的复杂地形环境下,完成了广西柳州钢铁厂热风炉的巡检工作。
正向下楼梯为什么是关键突破?
机器人的核心是代替人运动,能否与环境交互是评判运动控制难度的重要指标。其中,可以保证闭环的楼梯是足式机器人落地应用最为关键的场景。从简单到复杂分为三个难度:上楼梯、下楼梯、正向下楼梯。
逐际动力告诉「新皮层New New Thing」,“跳舞、空翻在机器人的运动控制中是最容易的,因为没有与环境交互。上下楼梯则不同。正向下楼梯时,机器人腿部可以运动的空间会少很多,因此对运动控制的要求更高。目前国内的四足机器人基本都做到了上楼梯,下楼梯完成度一般,正向下楼梯基本没有。”
足式机器人可以解决哪些需求?
逐际动力创始人张巍曾表示,足式机器人根据人的运动方式来行走,地形适应能力更强,在原理上能到任何人类可以到达的地方。
解决移动需求:让机器人能够从A到B做一件事,比如无人车、送餐机器人等;
解决操作需求:让机器人在从A到 B 的每个场景上操作,比如在移动的基础上加一个机械臂来完成更多的任务。
同行研究进展
波士顿动力四足机器人Spot Mini:2018年发布,是第一款在工业场景落地的四足机器人产品,采用全视觉方案构建全局地图,可以全自主在楼梯和复杂地形上攀爬,多功能载荷,搭载机械臂并实现机头稳定控制。2022年,Spot平台改进,环境感知能力增强;
特斯拉人形机器人Optimus:2022年亮相,全身能够完成超200个不同角度的动作,可以负重10公斤,并精准抓握小型零件。但该机器人尚未研发成功,距离投产应用仍有一段时间。
参考链接
https://mp.weixin.qq.com/s/la8eoext-8U0z9jk4FmJYg
玻色量子发布100个计算比特量子计算机
5月16日,北京玻色量子科技有限公司发布了相干光量子计算机“天工量子大脑”,该量子计算机拥有100个计算量子比特,可以解决最高超过100个变量的数学问题,且相比经典优化算法,平均求解速度加速超100倍,平均求解结果提高120%。
目前有哪几种量子计算架构?
通用量子计算架构:用于解决普遍问题,需要上百万甚至更多物理比特,目前以Google、IBM为代表;
专用量子计算架构:用于解决特定问题,只需相对少量的物理比特和特定量子算法,目前以D-Wave Systems公司为代表;
经典计算+量子计算混合架构:经典计算机负责传统的通用计算部分,基于AI深度学习、组合优化的量子计算负责承担算力,并加速解决经典计算机难以求解的问题,天工量子大脑便是基于这样的架构。
玻色量子认为,类似于AI大模型的“涌现”能力,当计算规模不断提升,量子计算的优势会逐步“涌现”。而相较于通用量子计算架构,混合架构将减少计算成本,进一步推动光量子计算领域实用化进程。
参考链接
https://www.jiqizhixin.com/articles/2023-05-17
-END-
新皮层New New Thing
Hello!
我们是一个诞生于GPT浪潮、由《第一财经》YiMagazine孵化的全新内容IP。
和每一位关心技术、关照人的命运的读者一样,我们希望在这个有史以来不确定性最高的时代,更好地理解快速变化的科技世界,也更好地理解生而为“高级智能”的我们自己。在这个目标下,我们计划从学术、商业、伦理、监管等多个角度报道和讨论与“智能”相关的议题。请注意,我们说的是智能,不只是AI。
若想了解更多资讯,请点击阅读往期智能晚报:
智能晚报|马斯克预计自家人形机器人能卖1-2亿台;苹果“个人语音”功能15分钟内克隆出你的声音...
若想了解更多大佬发言,请点击阅读往期大佬说:
今天大佬说了啥|Sam Altman出席听证会,保证未来6个月内不会训练GPT-5
喜欢就关注我们吧,记得“设为星标”哦~
与记者交流,可添加微信(请备注公司名称和姓名):
王杰夫 微信号: wjfsty
张司钰 微信号: helianthus351
吴洋洋 微信号: qitianjiuye
再次,喜欢就关注我们吧,记得“设为星标”